Queria saber…

Existem inúmeros títulos disponíveis no mercado e escolher entre eles pode ser difícil. Alguns títulos trazem a clássica mecânica dos jogos de RPG, outros trazem uma mecânica de construção de rotas, alguns deles focam em rolagem de dados, outros focam em construção de baralhos…têm jogos cuja temática principal é ficção científica, outros onde o foco é a economia ou, ainda, jogos com o tema de terror. Agora, misture todas essas e outras combinações de mecânicas e temas com diferentes graus de complexidade de regras e outras características (e.g., número de jogadores, durante da partida,…), e você começará a vislumbrar a diversidade de possibilidades existentes. Mas, será que existem tantas possibilidades assim? Afinal, quantas grupos de jogos de tabuleiro distintos existem - e quantas variações dentro de cada um deles?

Nesta seção deste aplicativo, eu busco entender a diversidade de títulos disponíveis e tentar fornecer alguma aproximação à pergunta: quantos títulos diferentes realmente existem? Minha hipótese principal é que existe sim uma diversidade grande de títulos mas, quando avaliamos uma amostra razoável deles, podemos sintetizá-los a um número menor de tipos distintos e identificar variações sobre o tema. Por exemplo, o Ticket to Ride é um título que ficou bem popular e, hoje, existem três jogos base e diversos suplementos para a franquia; ainda assim, por mais que sejam títulos distintos, todos eles seriam variações de um mesmo tema. Entender a diversidade de títulos e as variações deles é o meu objetivo aqui.

Antes de prosseguir, acho que vale a pena frisar duas coisas:

Bom, vamos começar?

Como caracterizar a diversidade de títulos?

A Ludopedia fornece algumas informações sobre cada título, e aqui focaremos em duas principais delas: as mecânicas e os temas - cada uma das quais são apresentadas nas respectivas tabelas abaixo.

Mecânicas encontradas entre os títulos avaliados
Ação Simultânea Colocação de Peças Eliminação de Jogadores Marcadores e Hexágonos Papel e Caneta Simulação
Ação/Movimento Programado Construção a partir de Modelo Especulação Financeira Memória Pedra-Papel-Tesoura Sistema de Pontos de Ação
Alocação de Trabalhadores Construção de Baralho/Peças Force sua sorte Mercado de Ações Pegar e Entregar Sistema por Impulsos
Apostas Construção de Rotas Gestão de Mão Movimento de Área Posicionamento Secreto Tabuleiro Modular
Atuação Controle/Influência de Área Impulso de Área Movimento em Grades Reconhecimento de Padrão Tempo real
Blefe Cooperativo Jogadores com Diferentes Habilidades Movimento Ponto-a-Ponto Rolagem de Dados Toma essa
Campanha/Batalhas Dirigidas por Cartas Dedução Jogo em Equipe Narração de Histórias Rolar e Mover Vazas/Truques
Cerco de Área Desenhar Leilão Negociação RPG Votação
Colecionar Componentes Desenhar Rota com Lápis Linha de Tempo Ordem de Fases Variável Seleção de Cartas
Temas encontrados entre os títulos avaliados
Adulto Cultura Brasileira Ficção Científica Luta/Artes Marciais Quadrinhos
Animais Cultura Oriental Gastronomia Medieval Religião
Anime/Manga Cultura Pop ou Geek Guerra Meio Ambiente Tema de Video Game
Arte Economia/Produção História Mitologia Transportes
Aventura Educacional Horror Piratas Vikings
Ciências Esportes Humor Policial
Civilização Fantasia Indeterminado Política
Cultura Africana Faroeste Literatura Pré-Histórico

Cada um dos títulos examinados pode ser caracterizado por uma combinação de mecânicas e temas descritas acima. Por exemplo, o Catan é representado pelas seguintes mecânicas e temas: Gestão de Mão, Construção de Rotas, Negociação, Rolagem de Dados, Tabuleiro Modular, Civilização, Economia/Produção; por outro lado, o Mansions of Madness é caracterizado por Gestão de Mão, Jogadores com Diferentes Habilidades, Movimento de Área, Pegar e Entregar, Rolagem de Dados, RPG, Tabuleiro Modular, Cooperativo, Dedução, Narração de Histórias, Aventura, Fantasia, Horror. Assim, cada título pode ser caracterizado pela presença ou ausência de cada uma destas características, de forma que podemos usar esta lógica para montar uma matriz em que temos cada um dos 500 títulos nas linhas e cada uma destas características nas colunas, onde cada célula indica se aquele jogo possui aquela característica ou não. Com esta matriz podemos então definir quão similares são dois ou mais títulos.

Para quantificar quão similares são estes títulos, utilizei aqui a métrica de dissimilaridade de Gower. Esta métrica é bastante útil quando queremos mensurar quão parecidas são duas ou mais entidades quando temos uma combinação de tipos de dados diferentes para caracterizá-las (e.g., numéricos, categóricos, ordinais, lógicos,…): duas instâncias (no nosso caso, os títulos) são totalmente similares entre si quando o valor desta métrica é 0, e totalmente dissimilares (i.e., diferentes) quando o valor desta métrica é 1. Desta forma, utilizei esta abordagem para calcular a dissimilaridade entre cada par de títulos com base na presença/ausência de cada uma das mecânicas e temas existentes, e apresento a distribuição dos valores observados no histograma abaixo.

Como podemos observar, grande parte dos valores de dissimilaridade entre os títulos encontra-se na faixa de 0 à 0.35 - sem que hajam pares de títulos cuja dissimilaridade seja maior do que este valor. Isto sugere que, no geral, a amostra dos jogos de tabuleiro analisados aqui tendem a compartilhar muitos elementos relacionados à sua mecanica e/ou temática. Em outras palavras, os títulos tendem a ser predominantemente similares uns aos outros.

Mas o que isso representa para a nossa pergunta? Será que estamos vendo um monte de jogos repetidos? Bom, para nos ajudar a avançar com estas perguntas, podemos alavancar uma das vantagens de se trabalhar com estas métricas de dissimilaridade, que é o fato delas nos permitirem visualizar quão dissimilares são os títulos conforme a figura abaixo (se você passar o mouse em cima de cada ponto, é possível ver qual título aquele ponto representa, bem como a mecânica e o tema associado aquele título). Esta figura é o resultado de um método chamado TSNE (t-distributed Stochastic Neighbor Embedding), que tenta mapear cada um dos títulos a um espaço simplificado, sem que com isso haja a perda de informação sobre a dissimilaridade entre os mesmos. Neste contexto, cada pontinho neste gráfico 2D é um dos 500 títulos examinados e a distância entre cada ponto representa a dissimilaridade entre eles - assim, títulos mais parecidos entre si estão mais próximos, e títulos muito diferentes tendem a estar em cantos opostos do gráfico.

Mas de que forma esta figura está no ajudando? Bom…se títulos similares tendem a estar muito próximos uns dos outros, o que acabaríamos tendo caso eles fossem totalmente ou muito similares seriam nuvens de pontos bastante sobrepostos. Apesar de observar algumas sobreposições entre um ou outro grupo de pontos, no geral, é bastante claro que existem diferenças entre eles. Além disso, é difícil encontrar grupos bem definidos através desta visualização. Portanto, apesar de alguns jogos parecerem repetições de outros, isso está muito mais para a exceção do que a regra. Ainda assim, será que não existe outra forma de tentar entender como estes jogos estão organizados e quuantas variações principais existem entre eles?

Como os títulos se organizam em torno de sua dissimilaridade?

Até aqui havíamos considera a possibilidade dos títulos formarem grupos bastante distintos e fáceis de serem identificados. Todavia, as análises feitas até agora demonstram exatamente o contrário: os grupos são bastante difíceis de serem identificados e o padrão de dissimilaridade entre os títulos sugere que eles estão organizados em um continuum de dissimilaridade. Dada esta características dos dados, podemos utilizar um outro tipo de visualização para determinar como os títulos estão organizados de acordo com a dissimilaridade nos padrões de presença/ausência de suas mecânicas e temas: um dendrograma, conforme apresentado na figura abaixo.

O dendrograma pode ser utilizado para visualizar a organização dos títulos examinados de acordo com a dissimilaridade entre eles. Títulos muito diferentes tendem a ser separados logo na raiz do dendrograma (área mais à esquerda da figura acima), e cada nova separação sucessiva tende a continuar segregando os mesmos até chegar às pontas do dendrograma - onde a similaridade entre os títulos seria a máxima. Desta forma, a figura acima demonstra que existe sim algum tipo de organização hierárquica dos títulos examinados e que, dependendodo valor de dissimilaridade adotado, podemos identificar grupos distintos de títulos. Por exemplo, se considerarmos o ponto de corte de 0.6 da dissimilaridade, teríamos 3 grupos distintos de títulos; por outro lado, se selecionássemos o ponto de 0.4 teríamos 7 grupos distintos. Assim, dependendo do ponto de corte definido por nós, podemos ter mais ou menos grupos de títulos sendo representados através do dendrograma. Para ficar claro este exercício, apresentamos a figura abaixo, que apresenta a relação entre o valor do ponto de corte da dissimilaridade adotado e a quantidade grupos distintos de jogos que seriam identificados caso aquele ponto de corte seja considerado.

Como podemos ver através desta figura, a quantidade de grupos identificados cai exponencialmente tanto maior é o ponto de corte da dissimilaridade (passe o mouse em cima dos pontos para ver os valores no detalhe). Além disso, é possível ver que é a partir do valor do ponto de corte de 0.2 que parece haver uma desaceleração da curva - o que poderia ser esperado se analisássemos aquele histograma no início desta página -, de forma que aumentar o valor do ponto de corte passa a ter um impacto cada vez menor sobre a quantidade de grupos distintos identificados. Mas que critério então usar para selecionar esse ponto de corte? Existem alguns critérios objetivos para isso mas, no final do dia, é necessário também empregar um pouco de parsimônia e bom senso - e podemos extrair isso já a partir desta figura.

Mas afinal, podemos chegar à uma estimativa da quantidade de jogos diferentes?

Se você der um zoom na figura acima, verá que que entre os pontos de corte de 0.15 e de 0.25 temos algum tipo de redução da velocidade de queda da quantidade de grupos com o aumento no valor do ponto de corte. Entretanto, é entre os valores de 0.16 e 0.17 é que ocorre a última queda com maior magnitude - de 69 para 56 grupos distintos - entre aumentos sucessivos no valor do ponto de corte. Assim, é a partir de 0.16 em que parece começar a haver uma maior perda de informação sobre a organização da diversidade de títulos, uma vez que muitos deles começam a ser alocados em um único grupo a partir deste ponto. É este o critério que usarei aqui para definir o ponto de corte apresentado no resto deste artigo. Podemos utilizar este valor do ponto de corte para podar o dendrograma criado, e sintetizar àquela figura complexa acima à uma forma um pouco mais simplificada conforme apresentada abaixo. Através dela podemos ver que temos pelo menos 69 grupos distintos de títulos.

Além disso, o histograma abaixo demonstra que grande parte dos grupos é formada por até 9 títulos, apesar de alguns outros grupos serem compostos por um número maior de títulos. Você pode ter acesso aos títulos que compõem cada um dos grupos identificados através do menu e dendrograma apresentados abaixo do histograma.

CONCLUSÕES

Nesta seção busquei fornecer uma primeira estimativa para (1) a quantidade de grupos distintos de títulos existentes e (2) a quantidade de variações existentes dentro de cada um desses grupos. As análises apresentadas aqui sugerem que existem, pelo menos 69 grupos distintos de títulos, e que a maior parte destes grupos é composto por até 9 títulos. O que isto pode nos dizer sobre os jogos de tabuleiro então? Como jogador, eu vejo que este grupos como as variações principais do que existe em termos de mecânicas e temas de jogo, enquanto os títulos dentro de cada grupo seriam as variações secundárias e/ou variações específicas dentro daquele grupo. Tomando como exemplo o Grupo 47, me parece que todos eles envolvem a construção de rotas com base em cartas ou algo parecido, mas existem aqueles jogos ali dentro em que esta pegada parece ser bem forte (como em Ticket to Ride) e outras nas quais esta pegada já é mais suave e mistura com outras mecânicas (como em Brass). Todavia, como analista destes dados, gostaria de exercitar um pouco de cuidado ao interpretar estes resultados e o que eles representam.

Em primeiro lugar, estes resultados são limitados pelos próprios títulos que os geraram. Não podemos perder de vista que utilizamos apenas os 500 jogos de tabuleiro mais bem avaliados pela comunidade ao construir estas relações e buscar estes padrões. Assim, caso exista algum tipo de viés na seleção destes jogos (e.g., os jogos mais bem votados representam por si só um recorte bem particular de mecânicas e temas), então este tipo de viés também estará presente na análise apresentada aqui. Além disso, por mais que este viés possa não existir, não há como saber se estes jogos são de fato uma amostra representativa daqueles que existem por aí - assumimos que sim. Portanto, não há como saber até que ponto estes resultados se aplicam apenas aos títulos examinados ou são de fato um padrão mais geral.

Um segundo ponto importante é que não existe um benchmark para nos informar se esta quantidade de grupos encontrados é razoável ou não, tampouco nos dizer se a quantidade de grupos e variações encontradas já é algo que possa ser considerado diverso ou não. Isto é bastante importante, uma vez que qualquer qualquer afirmação sobre a diversidade precisa ser feita com base em algum padrão pré-estabelecido. Na ausência destes, qualquer conclusão sobre a diversidade de títulos será puramente subjetiva.

Finalmente, apesar de eu ter empregado um critério objetivo para definir o ponto de corte para a análise feita aqui, ele está longe de ser o critério definitivo. Talvez, uma outra pessoa preferisse utilizar outro valor do ponto de corte através deste mesmo critério ou, ainda, utilizar um critério totalmente diferente. De uma forma ou de outra, é interessante notar que estas outras abordagens possivelmente não se afastariam tanto da quantidade de grupos distintos encontrados aqui. Por exemplo, variando o ponto de corte de 0.15 à 0.20 ainda teríamos algo como 75 à 36 grupos distintos de títulos - algo que parece ser bem razoável.

Se você curtiu estas análises, tem alguma dúvida, sugestão ou reclamação, é só entrar em contato comigo através do GitHub e no LinkedIn.